SpatialDB引发的10x技术原理的探究
单细胞RNA测序(scRNA-seq)技术的出现极大的推动了现代细胞和分子生物学的发展。scRNA-seq可以覆盖RNA-seq数据中的大量细胞子集,提供单个细胞的转录组信息,从而揭示细胞间的异质性。但当scRNA-seq应用于某些组织或系统研究时,就丢失了至关重要的空间位置信息。而单细胞空间转录组技术可以同时进行单细胞转录组测序并记录组织细胞的空间位置信息,在神经科学、发育生物学、免疫学和癌症等研究领域都有重要作用。
SpatialDB数据库
随着检测空间基因表达方法的不断出现,空间转录组数据正在迅速积累。由于方法的多样性和数据分析的复杂性,中国科学院生物物理研究所陈润生院士团队开发了针对空间转录组技术和数据集的数据库SpatialDB,供研究人员有效使用已发布的空间转录组数据。SpatialDB平台建立了空间转录组数据分析处理流程,实现了空间转录组数据的在线可视化,同时提供了空间差异表达基因及其功能富集分析的注释,可用于快速检索特定目标组织中的基因表达空间信息。相关研究成果已经发表在Nucleic Acids Research上。
目前,SpatialDB包含由8种空间转录组技术(ST,Slide-seq,LCM-seq,seqFISH,MERFISH,Liver single cell zonation,Geo-seq and Tomo-seq)产生的24个数据集,人类、小鼠、果蝇、秀丽隐杆线虫和斑马鱼这5个物种。对于数据集中来自不同组织、不同处理方法的样本或生物学重复等,研究团队将其手动划分为305个子数据集。数据库平台主要有以下功能:
可视化功能:SpatialDB为研究者提供了友好的Web界面,用于可视化和比较空间分辨率下的转录组数据。
数据分析功能:数据库提供的空间差异表达基因(spatially variable gene)及丰富的功能注释,有助于进一步数据分析。
资源库:SpatialDB为研究组织细胞的空间结构提供了一个资源库,并为了解疾病中的细胞微环境带来新的见解。
SpatialDB中介绍了各类空间转录组技术,然而贴合实际我们可以近距离接触的就是10xGenomics平台推出的10xVisium Spatial 技术。
10x的Visium Spatial Technology究竟是怎样实现的呢?在研究10x的Visium Spatial Technology之前,我们来巩固一下10xGenomics的单细胞技术。
10xGenomics单细胞技术
10xGenomics的单细胞技术的基础就是Gel bead(凝胶磁珠)。Gel bead由凝胶珠和磁珠上的一段引物构成,引物序列的构成如下图,依次为:全长Illumina TruSeq Read 1 测序引物、10x Barcode序列、unique molecular identifier (UMI)、poly(dT)VN随机序列引物。特异的引物探针的结构是单细胞技术的关键因素之一。
有了以上凝胶珠结构的介绍,我们来学习10x单细胞技术的原理。首先将制备好的细胞悬液、10x barcode凝胶磁珠和油滴分别加入到Chromium Chip B的不同小室(下图左),经由微流体“双十字”交叉系统形成GEM(下图右)。
整个油包水凝胶珠的操作过程如下图所示,为了获得单细胞反应体系,细胞悬液浓度建议控制在700-1200细胞/ul,因此产生的90-99%GEM不含有细胞,剩下的大部分GEM含有一个细胞。单个的GEM依次形成后再全部混匀,细胞裂解,凝胶珠自动溶解释放大量引物序列。
释放的引物中包含poly(dT)反转录引物,含有30个碱基的同聚DNA片段,一般具有启动子的作用,用于捕获有polyA尾的RNA,反转录并在扩增末端自动加上3个C,而反应buffer的TSO酶含有3个G会和C互补,以SMART方式完成二链的扩增。油滴破碎,磁珠纯化cDNA一链,PCR扩增cDNA。
cDNA扩增完成后酶切片段化并磁珠筛选最适片段,通过末端修复、加A、接头连接Read2测序引物,再以PCR方式构建含有P5和P7接头的cDNA文库。
最终构建的文库如下图所示。
基于以上文库的特征,10x单细胞的测序数据如下图Read1为对应Barcode和UMI序列,Read2为测序序列。其中Barcode指示reads来源的细胞,UMI指示reads基因组来源,其定量和去dup的作用。
通常一个细胞可以得到40000~80000个有效的UMI,平均一个细胞的一个基因有10个左右的UMI。得到测序序列后,我们可以对序列进行官方软件CellRanger分析,以及后续的PCA,Cluster聚类分析,差异表达基因分析等。
10x Visium空间基因表达技术流程
有了10x单细胞技术中凝胶珠引物结构和建库方式的基础,那么最热门的10xVisium Spatial Technology又是怎样实现它的空间特性呢?以下是来自10x官网的整套Visium空间转录组测序的方案,包括样品准备、电镜成像、标记与文库构建、测序、数据分析及可视化。
除了引物结构的特点外,最重要的工具即为下图的两张芯片,它们是组织优化芯片和文库构建芯片。因此也可以就此将其分为两大步骤:组织优化和文库构建。
组织优化:
组织优化过程如上图所示,其芯片由8个点阵组成,每个点阵包含了密集的探针区域,可以结合并捕获RNA,通过荧光检测结果确定最佳的组织优化条件。
将冷冻切片置于芯片上,对其进行H&E染色、透化之后,进行cDNA合成,而在dNTP上有SN3的荧光基团,可通过荧光显微镜的结果进行判断哪个实验条件下的组织切片所释放mRNA量最多。其中不同细胞结构能够被染成不同深浅的颜色,例如细胞核被苏木精染成鲜明的蓝色,胞浆被伊红染成深浅不同的粉红色至桃红色,胞浆内嗜酸性颗粒呈反光强的鲜红色等。
文库构建:
文库构建芯片由4个点阵组成,点阵大小为6.5mm×6.5mm;每个点阵上面有5000个spots,每个spot直径为55um,每个spot上面包含了上百万条引物探针,每条引物序列带有每个spot的位置标签,尾端带有Poly(dT)序列。其中每个oligo结构为:Read1引物、Spatial barcode、UMI、oligo(dT),引物探针的结构与10x单细胞技术的结构类似。其并不连接凝胶珠而是连接在芯片上。
组织进行切片放置在捕获区域上(用甲醇)进行固定、H&E染色,成像及透化后释放出的mRNA的PolyA尾结合探针的oligo(dT),反转录成cDNA;cDNA扩增、纯化和质控;片段化,末端修复,加A和连接头;cDNA扩增 , 制备测序文库。
最终形成的类似10x单细胞转录组的文库,如下图所示:
结果简单展示:
使用Space Ranger数据分析和loupe Browser软件可视化,实现了基于位置的细胞cluster分类和marker基因筛选,并进行基因表达特征分析,可以展示单个基因在整个组织中的表达分布。用10x官方的话说,就是测序一次,可以有成千上万种分析的角度,可以多方位的挖掘信息内容。以下便是简单的示例结果:
小鼠大脑中空间解决方案下的聚类和表达。A为小鼠冠状脑切片进行H&E染色,成像,然后通过空间基因表达工作流处理后的展示。同时图中还分别展示了组织学图像与UMI计数(B)、总基因计数(C)和基于总的差异表达的空间聚类数据(D)的图像叠加。图中最右侧显示的是cluster 4(绿色)中比其他任何聚类都高表达的top基因。
空间转录组中基因在小鼠大脑中的表达。A. H&E染色小鼠冠状脑切片。Selenow (B)和Hpca的空间mRNA表达(C)是大脑中已知表达模式基因的例子,主要是海马区。海马体的表达与已知的表达模式一致。其中Selenow基因表达硒蛋白是参与肌肉生长和分化,而神经元免受氧化应激的神经元发育过程中的保护;HPCA海马钙蛋白,并认为在一些物种中发挥中枢神经系统的神经细胞中起重要作用。
以上我们看到了空间转录组数据在鼠海马结构研究中的应用,而事实上科学家们正在使用这些前沿的技术探索更多未知的生命科学现象,期望技术的普及化。
让我们以赤子心探索未知,以前沿技术武装双手,奔向未来。
1.Zhen F , Runsheng C , Xiaowei C . SpatialDB: a database for spatially resolved transcriptomes[J]. Nucleic Acids Research.
2.https://www.spatialomics.org/SpatialDB
3.https://www.10xgenomics.com/
作者:椰子糖
审稿:童蒙
排版:amethyst
往期回顾